查看原文
其他

工具变量对因果效应的识别和外推, 大牛的顶级评述!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

photo courtesy: bing

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

关于下方文字内容,作者:张左敏暘,英国谢菲尔德大学经济学院,通信邮箱:piggyz@126.com
推荐:①用事件研究法进行因果识别如何做? 有什么好处? 与DID结合起来潜力无穷!中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!

Identification and Extrapolation of Causal Effects with Instrumental Variables, Annual Review of Economics

Instrumental variables (IV) are widely used in economics to address selection on unobservables. Standard IV methods produce estimates of causal effects that are specific to individuals whose behavior can be manipulated by the instrument at hand. In many cases, these individuals are not the same as those who would be induced to treatment by an intervention or policy of interest to the researcher. The average causal effect for the two groups can differ significantly if the effect of the treatment varies systematically with unobserved factors that are correlated with treatment choice. We review the implications of this type of unobserved heterogeneity for the interpretation of standard IV methods and for their relevance to policy evaluation. We argue that making inferences about policy-relevant parameters typically requires extrapolating from the individuals affected by the instrument to the individuals who would be induced to treatment by the policy under consideration. We discuss a variety of alternatives to standard IV methods that can be used to rigorously perform this extrapolation. We show that many of these approaches can be nested as special cases of a general framework that embraces the possibility of partial identification.

工具变量(IV)在存在不可观测变量的情况下可以帮助研究者进行因果识别,解决部分样本选择问题。但是传统标准的IV提供的是样本能够被IV影响的那部分估计,在很多情况下这些样本和因政策干预带来的不完全一样。处理组与控制组的平均因果效应可能因与不可观测的变量相关而存在显著差异,然而这不一定是政策本身带来的影响。在文中作者认为有效的因果推断要求从被IV影响的样本以及潜在的会被政策纳入影响范围的样本进行外推(Extrapolation)。
那么什么样的情况需要这样的外推?至少有以下两种情形。第一种是政策无法影响的工具变量的自然事件,比如天气,这类工具变量通常被认为是外生。但是他们存在无法外推(External Validity)的代价。通常被政策影响的样本行为与潜在可能被政策影响的样本行为不同,如果这个成立的话,传统的IV推断的政策效果将存在巨大问题。而外推法可以评估被准自然实验影响的组的规模或成分的实证结果敏感程度。第二种是如果研究者想知道扩大政策或收缩政策可能带来的效果。

一.理论模型

潜在因果模型(Potential Outcome Framework)将观测值与潜在结果的关系进行如下描述:
其中D是选择变量。但是一般而言D是内生的,它取决于其他的变量。那么,如果此时有工具变量Z在保证其他变量X不变的情况下,完全决定了D,那么政策效果的因果推断有效。但是问题就是如何保证处理组的样本都是因为这个外生变量Z,而不带有样本自选择问题?
那么关键问题就是Z如何影响选择变量D。沿用Imbens和Angrist(1994)的假设,需要加上单调性条件(Monotonicity Condition)。简单而言,给定变量X,Z的外生性变化使得D轻微上升或者轻微下降。Vytlacil(2002)给出等价表达式:
其中是未知函数,U是连续分布的随机变量。为了给出理论模型,作者维持了以下三个假设。
图1
图1展示了当不可观测因素上升时,之间的差在上升,而不是一个常数。

四.目标参数

(1)传统目标参数

研究者在进行识别之前需要明确自己想要知道什么参数,为了统一框架,仅要求感兴趣的参数可以被写成未知MTR函数的加权平均值,即:
其中重要的就是权重的选择。表1展示了不同权重的选择对应着传统的不同指标ATE、ATT、ATU等。图2展示了不同权重下传统参数的不同数值。
表1
图2

(2)政策相关处理效应(Policy-Relevant Treatment Effect)(PRTE)

传统的ATE、ATT、ATU等评估指标存在评价缺陷,它只能回答某一方面的问题。例如高等教育人力资本投资与劳动回报的关系。传统指标只能回答的是上大学或者不上大学的效应,而不能回答的是增加学生贷款或者提高大学可读性的效应。
表2

(3)外推LATE

假设研究者想要做LATE稳健性的敏感性分析,定义左边与右边程度的外推如下:
图3

五.如何非参数识别目标参数

表3
图4
图5
图6
图7
进一步地,理论模型允许研究者将非参数的限定嵌入MTR函数。图8展示了将MTR函数为递减函数的假设嵌入模型得到的上界,跟图5相比,不同的地方在于限制了必须随着的上升而下降(关于不同形式的非参数设定讨论,详见原文5.5)。
图8
基础函数的讨论暂时告一段落,接下来讨论的问题是如何选择工具变量函数的设定(IV-like Specification)。图9采用OLS和Z=2到Z=4的类IV估计重新计算了图8的边界,结果显示边界变窄了。如何选择类IV进行工具以穷尽所有可得信息是研究者需要考虑的问题(Mogstad et al,2017)。对于识别来说,唯一困难的在于扩大IV会增加计算难度,研究者们要考虑从哪里着手解决这个问题(详见原文5.6)。
关于识别的最后一个问题是如何确定界限的宽度。界限的宽度取决于三个因素。第一是采用外推函数的阶数、第二是先验假设的强度、第三是IV所携带信息的强度。界限的宽度取决于这三个因素的权衡。图10展示了这些界限在三种信息集下如何随着改变而改变。图11与图10的区别在于揭示了研究者需要权衡外推的程度与先验假设的强度,没有免费的午餐。
图9
图10
图11
当然,还存在的一个问题是计算参数的最优化问题由于可行集为空而无解,可能的原因是可行集没有约束。但是尽管可行集有预先的约束,还是可能无解。如表4所示,这个可以被用作于检验选择偏误的一个思路,可以用于检验政策影响外生性程度如何。
表4

六.其他外推方法

这部分作者探讨了以往文献中使用的外推方法,并指出这些方法其实是第五部分一般推断框架的特殊情况而已,其实就是对MTR函数进行了不同程度的限制的特例(具体详见原文第六部分)。

七.结论与未来研究

此文的中心是讨论PRTE相较于传统的政策评价指标更加一般化与灵活化,可以回答传统评价指标所不能回答的问题。但本文仅限于二项处理(Binary Treatment)问题,还可以扩展到连续型(Continuous)和有序型处理(Ordered Treatment)的问题。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存